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摘要 : 【 目的 ] 标签 云 可 用 于 信息 检索 推荐 和 导航 ,由 于 用 户 标注 具有 时 序 特征 ,为 有 效 揭示 用 户 兴 趣 动态 变化 ， 
提出 基于 时 序 演 化 的 用 户 动态 标签 云 构建 方法 。[ 方法 ] 利用 心理 学 中 记忆 的 遗忘 和 加 强 特征 构建 标签 的 动态 权 
E, 从 而 建立 用 户 动态 标签 云 以 反映 用 户 关注 点 的 变化 。[ 结果 ] 与 现 有 的 标签 云 算法 比较 , 构建 的 用 户 动 态 标 
签 云 算法 能 够 根据 用 户 动态 变化 的 兴趣 有 效 地 对 标签 进行 排序 , 在 用 户 兴趣 标签 的 预测 效果 上 明显 高 于 其 他 算 
iE, 并 具有 更 高 的 推荐 准确 率 。[ 局 限 】 因 为 用 户 兴趣 在 短 时间 周 期 内 不 会 有 太 大 变化 , 动态 的 方法 在 短 时 间 周 


期 内 的 预测 效果 不 是 很 显著 , 但 在 长 时 间 周 期 表现 上 更 为 显著 。[ 结论 ] 基于 时 序 演 化 的 用 户 动 态 标 签 云 能 有 效 
地 把 握 用 户 当 前 的 兴趣 热点 ， 提 高 个 性 化 检索 和 导航 的 效果 。 
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近年 来 ，Web 2.0 为 互联 网 带 来 了 实质 性 的 变化 ， 
用 户 在 网 络 环境 中 的 角色 也 从 网 络 信息 的 被 动 接受 者 
转换 为 网 络 信息 的 主动 创造 者 。 社 会 化 标注 作为 Web 
2.0 的 一 个 核心 构件 ， 人 允许 大 众 用 户 采 用 标签 的 方式 
对 自己 感 兴趣 的 资源 基于 自身 理解 进行 无 约束 标注 ， 
且 所 有 用 户 的 标注 都 互 为 可 见 癌 。 以 Flicker, Delicious 


检索 推荐 技术 , 通过 标签 的 可 视 化 属性 体现 不 同 标签 
的 重要 程度 ,可 以 对 用 户 浏览 产生 导向 作用 ,从 而 将 
用 户 的 关注 点 吸引 到 特定 字段 或 区 域 。Millen 等 四 研 
究 用 户 在 标签 云 形势 下 的 查询 浏览 习惯 ， 发 现 社会 化 
标签 是 提高 社会 化 导航 的 重要 途径 。Hassan-Montero 
等 中 通过 定义 标签 描述 资源 的 程度 、 覆 盖 资 源 的 数量 
等 指标 的 方式 来 计算 标签 的 有 用 性 ,并 通过 聚 类 算法 
提高 浏览 体验 。 此 外 , 标签 云 作为 社会 化 信息 的 导航 


为 代表 的 一 系列 以 大 众 用 户 参 与 为 中 心 的 社会 化 标签 
站 点 逐渐 发 展 壮 大 , 社会 化 标签 站 点 已 成 为 用 户 有 效 
获取 信息 资源 的 一 种 新 渠道 。 

标签 作为 社会 化 标注 系统 的 载体 , 成 为 Web 2.0 
时 代 一 种 重要 的 信息 组 织 工具 。 社 会 化 标签 具有 丰富 
的 信息 , 标签 云 (Tag Cloud) 作 为 具有 可 视 权 重 的 标签 
集合 , 它 的 出 现 很 好 地 解决 了 标签 信息 的 可 视 化 问题 ， 
帮助 用 户 快速 从 大 量 标签 中 获取 有 价值 的 信息 。 目 前 
关于 标签 云 的 研究 主要 有 排序 算法 中、 个 性 化 推荐 站 
及 可 视 化 布局 "等, 这些 研究 与 实践 有 力 地 推动 了 标 
签 云 应 用 与 理论 的 发 展 。 同 时 标签 云 作 为 一 种 新 兴 的 


接口 , 通过 可 视 化 形式 对 标签 属性 及 内 容 分 类 后 可 以 
对 不 同 用 户 进 行 个 性 化 搜索 推荐 。 夏 环 等 马 基 于 
Wikidata 知识 库 的 结构 和 内 容 , 通过 构建 标签 云 将 信息 
进行 标签 化 处 理 , 最 终 实现 信息 的 检索 和 页 面 的 排序 。 

现 有 标签 云 主要 是 根据 标签 累计 被 标注 的 次 数 为 
RE, 定量 地 计算 出 每 个 标签 的 权 值 , 并 使 用 不 同 的 
颜色 或 字体 大 小 形象 直观 地 实现 可 视 化 ,以 便于 用 户 
检索 和 浏览 。 用 户 所 使 用 的 标签 在 一 定 程度 上 能 够 体 
现 用 户 的 兴趣 ， 随 着 时 间 的 变化 , 用 户 的 兴趣 偏好 和 
关注 点 将 产生 变化 , 而 现 有 基于 标签 累计 频次 构建 的 


标签 去 并 不 能 很 好 地 反映 出 这 种 变化 。 因 此 ， 如何 根 
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据 用 户 在 不 同时 间 所 使 用 的 标签 构建 出 用 户 动态 的 标 
签 云 , 以 揭示 用 户 的 兴趣 和 关注 点 变化 , 已 成 为 如 何 
利用 标签 云 更 好 地 支持 用 户 信 息 检索 和 导航 的 一 个 重 
要 问题 ,为 此 ,本 文 将 从 用 户 标注 的 时 序 特征 出 发 , 研 
究 反 映 用 户 兴 趣 动态 变化 的 标签 云 构 建 方法 。 


2 ”用户 动 态 标 签 云 构建 


用 户 动态 标签 云 的 构建 需要 充分 考虑 时 序 信息 对 
用 户 标签 使 用 的 影响 。 根 据 心理 学 的 遗忘 特征 和 记忆 
加 强 现象 ,将 整个 用 户 标注 的 过 程 看 作 是 遗忘 过 程 和 
重复 学 习 过 程 。 即 距离 用 户 标 注 时 间 越 远 的 标签 重要 
性 越 低 , 重复 出 现 的 标签 重要 性 又 会 强化 , 通过 这 样 
的 过 程 动态 地 计算 不 同 标签 的 权重 , 构建 动态 标签 云 ， 
以 提高 用 户 浏览 体验 。 
2.1 标签 权重 的 动态 更 新 

用 户 的 兴趣 会 随 着 时 间 不 断 地 发 生变 化 , 用 户 兴 
趣 的 改变 是 一 种 遗忘 现象 , 根据 心理 学 的 遗忘 特征 和 
记忆 加 强 现象 具有 如 下 基本 特征 : 

(1) 距离 当前 时 刻 越 近 的 兴趣 具有 更 高 的 权重 ， 
且 兴 趣 的 权重 会 随 着 时 间 的 推移 逐渐 下 降 ; 

(D 当 相同 的 兴趣 重复 出 现时 , 会 有 一 个 兴趣 重 
复 强化 的 过 程 , 与 原 有 兴趣 合并 构成 新 的 用 户 兴 趣 。 

所 以 对 于 每 个 兴趣 而 言 , 都 有 遗忘 的 过 程 和 重复 
学 习 的 过 程 。 标 签 是 用 户 自身 态度 和 兴趣 的 表达 ， 因 
此 可 以 利用 兴趣 记忆 的 遗忘 和 加 强 特 征 来 更 新 用 户 标 
签 的 动态 权重 ,以 反映 时 间 对 标签 权重 的 影响 ， 从 而 


支持 动态 标签 云 的 构建 。 用 权重 来 衡量 用 户 对 标签 t 
的 兴趣 程度 , 那么 标签 权重 w, 也 有 衰减 和 强化 的 变 
化 过 程 , 形成 多 阶段 衰减 过 程 ， 如 图 1 所 示 。 
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强化 过 程 


遗忘 过 程 
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在 图 1 rp, 在 某 个 时 间 段 内 (如 从 do 至 dii), w, 
随 着 时 间 的 推移 发 生 了 衰减 。 而 当 用 户 持续 地 在 社会 
化 标签 系统 中 进行 标注 的 过 程 中 , 相同 的 兴趣 会 阶段 
性 地 重复 出 现 (如 在 du 和 d 时 刻 重 复出 现 了 标签 t), 
则 标签 权重 w, 得 到 加 强 而 重新 上 升 。 这 样 的 重复 活 
动 将 用 户 整 个 标注 过 程 分 成 多 个 子 阶段 ， 每 一 个 子 阶 
段 都 是 一 个 新 的 遗忘 过 程 。 因 此, 根据 于 洪涛 等 中 、 印 
桂 生 等 外 构建 的 类 似 的 遗忘 曲线 计算 公式 , 笔者 在 此 
基础 上 改进 并 提出 标签 动态 权重 的 计算 公式 。 标 签 ty 
的 动态 权重 w,， 的 计算 涉及 的 三 个 主要 环节 : 特定 时 
间 点 上 权重 计算 、 遗 忘 衰减 和 记忆 加 强 。 

(1) 时 间 点 上 的 标签 权重 计算 

标签 如 在 特定 时 间 点 T 上 的 权重 wi 通过 TF( 词 
频 ) 方 法 计算 ， 即 用 标签 & 使 用 的 次 数 占 该 时 间 点 上 
(如 可 取 某 一 天 ) 所 有 标签 使 用 次 数 的 比例 ,计算 方法 
如 公式 (1) 所 示 。 


wr = S0 m 
* facul 

其 中 , m 为 该 时 间 点 上 所 有 标签 数量 , tf) 为 标 
签 .出现 的 频数 。 

(2) 标签 权重 的 遗忘 衰减 

标签 丸 没有 重复 出 现 , 那么 标签 的 权重 w, 随时 
间 发 生 了 衰减 , 可 采用 指数 形式 的 遗忘 函数 进行 计算 ， 
w, 遗忘 过 程 的 量化 函数 定义 为 公式 (2)。 


D2 d-d) 


w, (d)=w, (d, ,Y'e ™ Q) 

其 中 ，w (d) 为 衰减 后 的 标签 权重 ，W (d, 1) 为 
PRZ t SR 于 1 次 出 现时 的 权重 ( 即 上 一 个 遗忘 阶段 的 初 
始 值 ); hl, 是 用户 4 的 半衰期 , 随 着 用 户 知 识 获 取 行 为 周 
期 而 不 同 ; dd 表示 距离 上 次 标签 出现 的 时 间 差 。 

(3) 标签 权重 的 记忆 强化 

如 图 1 所 示 , 在 dm, dio, dua 三 个 时 间 点 , 标签 ti 
重复 出 现 , 可 以 看 到 WwW (d,) 的 值 由 上 一 阶段 标签 t 
权重 衰减 的 剩余 量 和 新 的 标注 活动 同一 标签 女 带 来 的 
权重 增加 量 合并 而 成 , 使 用 公式 (3) 计 算 每 个 遗忘 阶段 
的 初始 兴趣 度 w (d,)' 


In2 
(d, -d, 4) 


w, (d,)' 2 wl" (d,) +w, (d, ye ^ — Q3) 
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其 中 ，w, (d, 28 d, SLAP AEG, dy fR 
表 标 签 4 第 次 出 现 的 时 间 点 ,那么 dd 则 是 相信 
两 次 标签 如 出现 的 时 间 差 ; wd) DB m 次 标签 1 
出 现时 的 权重 ,其 计算 方法 已 经 由 公式 (1) 给 出 , 在 这 
里 代表 在 4, 时 间 点 的 标注 活动 为 标签 带 来 的 权重 增 

ln2 

加 量 。Ww (dae 人 ““” 即 为 标签 t BORA EU 
PERMEI d, 时 间 点 的 剩余 量 。 
12 动态 标签 云 构建 算法 

根据 上 述 标签 权重 的 动态 更 新 机 制 , 建立 如 下 动 
态 标签 云 构建 算法 。 

输入 : 用 户 站 的 标注 历史 记录 ( 含 标注 的 时 间 、 资 源 和 使 


用 的 标签 ) 
输出 : 用 户 的 动态 标签 云 
算法 描述 : 


利用 公式 (1) 计 算 用 户 标注 初始 的 标签 兴趣 权重 ,得 
到 每 个 标签 在 不 同时 间 点 上 (通常 以 天 为 计 ) 的 权重 。 

@ 将 标签 按时 间 先 后 顺序 进行 排序 判断 标签 大 有 没有 
重复 出 现 ， 如 果 没 有 则 进入 步骤 @@ 对 标签 权重 进行 更 新 ; 如 
果 有 则 进入 步骤 中 对 标签 权重 进行 更 新 。 

@@ 根 据 公 式 (2) 计 算 标 签 衰减 后 的 标签 权重 。 

图 根据 公式 (3) 计 算 强 化 后 的 标签 权重 ,由 上 一 阶段 的 
衰减 值 和 新 标注 活动 带 来 的 权重 增加 量 合并 而 成 。 

@ 综 合 每 个 标签 的 权重 并 进行 归 一 化 处 理 , 得 到 用 户 u 


3 实验 研究 


31 实验 数据 
实验 数据 来 源 于 Last.fm 和 Delicious 两 个 具有 代 
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本 文选 取 活 跃 度 ( 即 标 注 的 资源 数 ) 较 高 的 用 户 ， 
对 其 标注 活动 数据 进行 实验 研究 ,选取 的 标注 数据 包 
含 用 户 、 资 源 、 标 签 和 标注 时 间 等 信息 , 车 有 多 个 标 
签 用 于 一 个 资源 的 标注 , 则 形成 多 条 记录 , 示例 数据 
如 表 2 所 示 。 


表 2 标注 数据 示例 


UserID ResourceID TagID TagTime 
626177 7864044 2521 2009/1/27 
626177 7864044 7833 2009/1/27 
626177 7864044 7192 2009/1/27 
626177 34862262 7833 2009/1/29 
626177 34862262 94 2009/1/29 
625254 7864044 2521 2009/1/30 
625254 7864044 7833 2009/1/30 
625254 7864044 289 2009/1/30 
625254 7864044 5032 2009/1/30 


3.2 ”用 户 动态 标签 云 的 可 视 化 

为 直观 反映 动态 标签 云 的 效果 ,选取 典型 用 户 的 
标签 云 可 视 化 结果 进行 比较 。 分 别 使 用 现 有 的 累计 标 
注 频次 方法 和 上 述 提出 的 动态 标签 云 构建 方法 建立 可 
视 化 标签 云 ， 以 字体 大 小 对 标签 权重 进行 区 分 。 图 2 
为 Delicious 某 活跃 用 户 (UserID: 12116) 到 第 6 个 月 末 
时 ( 即 标注 截止 时 间 ) 两 种 方法 构建 的 标签 云 可 视 化 结 
果 ( 对 前 50 个 热门 标签 进行 显示 ), 标签 的 字号 越 大 表 
示 该 标签 的 权重 越 高 。 该 用 户 在 6 个 月 内 共 进 行 2 710 
次 标注 ， 其 中 标注 资源 数 995 个 , 使 用 标签 数 424 个 ， 
使 用 最 多 的 标签 频次 达到 447 次 , 最 低 的 为 1 次 。 


表 性 的 社会 化 标注 系统 ，Delicious 的 数据 取 自 北京 大 
学 DAIM 研究 组 收集 的 Delicious 网 站 在 2009 4E 1 H 
至 6 月 期 间 18 万 多 用 户 的 社会 化 标注 数据 ,下 载 网 址 
为 : http://www.datatang.com/data/42989; Last.fm 的 数据 
取 自 于 马德里 自治 大 学 信息 检索 组 收集 的 1 892 名 用 
户 的 音乐 标注 数据 信息 ， 下载 网 址 为 : http:/ 
grouplens.org/datasets/hetrec-2011。 实 验 数 据 的 基本 统 
计 如 表 1 所 示 。 
表 1 实验 数据 基本 统计 


数据 集 ”用 户 数 。 资源 数 。” 标签 数 时 间 跨 度 
Delicious 185068 4153293 939036 2009.1-2009.6 
Last.fm 1 892 17632 11946 2005.8-2011.5 
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(b) 考虑 标注 时 序 信息 的 动态 标签 去 


图 2 两 种 不 同方 法 构建 的 可 视 化 标签 云 比较 
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图 2 的 可 视 化 标签 云 可 见 ， 以 现 有 累计 标注 频 
次 构建 的 静态 标签 云 与 本 文 提出 的 考虑 标注 时 序 信息 
构建 的 动态 标签 云 所 得 到 的 标签 权重 相对 大 小 是 有 差 
FH, 因而 在 引导 用 户 对 信息 检索 和 导航 的 相对 优先 
顺序 上 也 将 产生 不 同 效果 。 
3.3 ”用 户 动态 标签 云 导航 效果 评价 

为 进一步 检验 提出 构建 的 动态 标签 云 是否 更 好 地 
反映 了 用 户 兴趣 的 变化 , 起 到 更 好 的 信息 检索 和 导航 
作用 , 开展 了 定量 化 的 比较 实验 研究 。 因 为 若 用 户 当 
前 对 某 个 标签 感 兴趣 , 则 其 会 在 未 来 一 段 时 间 继 续 使 
H, 所 以 以 在 某 个 时 间 点 上 标签 权 值 大 的 前 N 个 标签 
在 未 来 一 段 时 间 内 被 用 户 再 次 标注 使 用 的 情况 构建 评 
价 指标 , 以 表征 标签 云 对 用 户 兴趣 刻画 情况 。 为 此 首 
先 定义 两 个 基本 的 评价 指标 公式 , 分 别 如 公式 (4) 和 公 
式 (5) 所 示 。 


Acc = ES (4) 
Rec = E (5) 
0 


其 中 ,mx 为 排名 前 个 标签 在 未 来 一 段 时 间 内 被 
标注 使 用 的 总 次 数 ;nn 为 在 未 来 一 段 时 间 内 用 户 标注 
使 用 的 标签 总 次 数 。 从 指标 定义 可 见 , Acc 表示 排名 前 
N 个 标签 在 未 来 一 段 时 间 被 标注 使 用 的 平均 频次 , Rec 
表示 排名 前 入 个 标签 使 用 的 总 频次 占用 户 在 该 段 时 间 
内 所 有 使 用 标签 频次 的 比率 。 因 此 , 这 两 个 基本 指标 
分 别 从 不 同 视 角 表 征 排名 前 个 标签 在 未 来 一 段 时 间 
被 使 用 的 情况 , 为 此 结合 二 者 定义 新 的 指标 作为 综合 
评价 指标 , 如 公式 (6) 所 示 。 


2 
ny 


AR - Acc- Rec = IA... = (6) 
nj N- 


以 Delicious 实验 数据 集 为 例 , 选取 数据 集中 15 
个 有 比较 完整 标注 历史 的 用 户 ( 即 这 些 用 户 基 本 上 有 6 
个 月 的 持续 标注 活动 ) 为 对 象 。 将 数据 集 跨越 的 6 个 月 
时 间 按 先后 顺序 分 为 36 个 周期 , 每 个 周期 为 5 天。 S 
k-1,2, 36, 取 第 个 周期 结束 时 的 标签 权 值 ， 按 大 
小 排名 前 10、 前 20 和 前 30 个 标签 , 计算 这 些 标签 在 
第 夺 1 个 周期 的 5 天 内 的 使 用 情况 , 计算 出 4R 评 价 指 
标 值 。 例 如 ， 当 取 大 2 时 , 计算 出 到 第 10 天 时 用 户 标 
签 权 重 排名 的 前 10.20 和 30 个 标签 , 然后 使 用 之 后 5 
天 ( 即 从 第 11 天 到 第 15 天 的 第 3 个 周期 ) 的 用 户 标 注 


数据 分 析 与 知识 发现 


广 | 上 ”Vi 人 { 生 甘 日 工 | 
ChinaXiv C FARHTU 


ELLO ANN 


数据 来 计算 评价 指标 值 , 依次 类 推 。 为 避免 用 户 在 标 
注 开 始 阶段 的 随机 性 影响 ,在 具体 实验 过 程 中 从 第 
20 个 周期 开始 计算 相应 的 评价 指标 值 。 同 样 , Lastfm 
以 15 个 活跃 用 户 为 研究 对 象 ， 由 于 该 数据 集 时间 跨 
度 比较 大 , 将 数据 集 跨越 的 6 年 时 间 按 先后 顺序 分 为 
12 个 周期 , 每 个 周期 6 个 月 , 评价 方法 同 Delicious 
数据 集 。 

为 检验 本 文 提出 的 标注 时 序 信息 构建 的 动态 标签 
云 与 现 有 以 累计 标注 频次 构建 的 静态 标签 云 在 反映 用 
户 兴 趣 度 上 的 差异 , 在 分 别 计算 得 到 两 者 综合 评价 指 
标 AR 值 后 ,计算 它们 的 比值 , 如 公式 (7) 所 示 。 

AR, 
"AR, (7) 

其 中 , 4Rp 和 ARs 分 别 为 动态 标签 云 方法 和 静态 标 
签 云 方法 计算 得 到 的 综合 评价 指标 值 。 

图 3 为 选取 15 个 用 户 用 两 种 方法 进行 比较 的 结 
果 。 可 见 , 在 观测 的 标签 权 值 排 前 10、20 和 30 个 标 
Ak, 动态 方法 相 较 于 静态 方法 都 有 不 同 程度 的 提升 ， 
Delicious 数据 集 的 提升 从 4% 到 11% 不 等 , 而 Last.fm 
数据 集 提升 显著 ,从 18% 到 82%。 


1.15 
1.10 
1.06 
1.05 me 
X X] 
ET 
ese] Xx] 
1.00 iux AS 
TOP10 TOP20 
(a) Delicious 数 据 集 R 值 
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1.80 
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EF ) 
zie a 
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(b) Last.fm 数 据 集 R 值 


图 3 动态 标签 云 相 较 于 静态 标签 云 的 提升 效果 
现 有 的 实验 结果 来 看 Delicious 数据 集 的 提高 效 

是 十 分 显著 , 因为 在 6 个 月 的 短 时 间 内 的 兴 

常 并 没有 发 生 本 质 上 的 变化 , 对 于 时 间 周 期 更 长 的 
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Last.fm 数据 集 ， 动 态 方法 相 较 于 静态 方法 的 提高 效果 
显著 ， 这 表明 基于 标注 时 序 信息 构建 的 动态 标签 云 能 
够 更 好 地 反映 用 户 兴 趣 的 变化 , 更 好 地 起 到 对 信息 检 
索 和 导航 作用 。 

另外 , ER Last.fm 实验 数据 和 相同 的 测评 指标 
下 , 将 动态 方法 和 其 他 方法 进行 对 比 实验 , 选择 的 对 
比方 法 为 基于 累计 频次 的 方法 (TF) 和 文献 [8] 提 出 的 标 
签 时 间 权 策略 , 包括 TF 时 间 权 和 TFIDF 时 间 权 。 由 
图 4 可 知 , 动态 方法 的 效果 高 于 其 他 方法 , 具有 较 高 
的 推荐 准确 率 。 
4.00 
3.00 EM ms 
2.00 
1.00 
0.00 


TOPS TOP8 TOP10 TOPIS TOP20 TOP25 TOP30 
—e— TFIDF 时 间 权 一 和 一 TF 时 间 权 —— TF 一 0 一 动态 方法 


图 4 4 种 不 同方 法 的 AR fü 


为 使 标签 云 更 好 地 反映 出 用 户 当 前 的 动态 兴趣 ， 
基于 用 户 兴 趣 动 态 变 化 的 特性 和 社会 化 标注 的 时 序 特 
征 , 提出 基于 时 序 演化 的 用 户 动态 标签 云 构 建 方法 。 
该 方法 基于 心理 学 中 记忆 的 遗忘 和 加 强 特征 构建 标签 
的 动态 权重 。 从 实验 结果 看 , 动态 标签 云 的 可 视 化 结 
果 有 别 于 现 有 以 累计 标注 频次 构建 的 静态 标签 云 , 与 
现 有 的 标签 排序 算法 比较 ,动态 方法 优 于 其 他 算法 ， 
并 且 能 够 刻画 和 把 握 用 户 当 前 兴趣 ,有 利于 更 好 地 帮 


助 用 户 利用 标签 云 进行 信息 检索 和 导航 。 标 签 只 是 反 
映 用 户 兴趣 的 一 个 单一 词汇 ,而 用 户 的 兴趣 往往 是 由 


多 个 标签 形成 的 集合 所 刻画 的 主题 , 因此 如 何在 现 有 
动态 标签 云 基础 上 进一步 挖掘 用 户 的 兴趣 主题 将 是 下 
一 步 开 展 的 工作 。 
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Constructing Dynamic Social Tag Cloud for User Interests 


Xie Mengyao Pan Xuwei 
(School of Economics and Management, Zhejiang Sci-Tech University, Hangzhou 310018, China) 


Abstract: [Objective] Social tags can be used for the recommendation and navigation sections of information retrieval 
systems. This paper proposes a method to construct a dynamic user tag cloud based on the temporal evolution to reveal 
the changes of user interests. [Methods] We established the tags’ dynamic weights with the forgetting and strengthening 
characteristics of memory in psychology. Thus, the dynamic user tag cloud reflect user's changing focus. [Results] 
Compared with the existing ones, the proposed algorithm could effectively sort the tags, and then make accurate 
predictions or recommendations. [Limitations] The proposed method performed well over long period of time because 
user's interests do not change significantly in a short period of time. [Conclusions] The proposed algorithm could 
effectively identify user's interests and then improve the personalized services. 


Keywords: Social Tagging Tag User Interests Dynamic Tag Cloud 
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